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Editoriale 


Gianfranco Barbieri 
Direttore di 
"Elettronica e Telecomunicazioni" 


Il mondo della radiodiffusione digitale è caratte¬ 
rizzato da un persistente dinamismo. Esso richiede 
flessibilità per adattarsi alle istanze sollevate dal 
sempre più rapido sviluppo delle tecnologie, da una 
migliore efficienza spettrale, la comparsa di nuove 
applicazioni e servizi. 

La radiofonia è oggi al centro di questa evoluzione, 
con l'espandersi della famiglia di standard basati 
sulla normativa Eureka 147, in cui sono compresi 
l'originario DAB {Digital Audio Broadcasting) ed il 
DAB-e, per la radiofonia digitale, e il DMB {DigitalMe¬ 
dia Broadcasting) per la radio e la TV mobile; il World 
DMB Forum ha il compito di sovrintendere allo 
sviluppo dei suddetti standard, offrire assistenza 
nelle procedure di normalizzazione nelle varie aree 
del mondo e promuovere lo sviluppo industriale 
delle tecnologie DAB, DAB-e e DMB. 

In base ai dati forniti dal World DMB Forum (www. 
worlddab.org) attualmente più di 500 milioni di 
utenti a livello mondiale sono in grado di ricevere 
circa 1300 servizi DAB/DAB-e/DMB. Ricevitori com¬ 


merciali DAB sono stati in alcuni paesi immessi sul 
mercato fin dal 1998; attualmente sono commer¬ 
cialmente disponibili più di 300 differenti modelli. 

Una citazione particolare merita lo standard DAB-e 
Q uando il DAB venne sviluppato alla fine degli 
anni '80 esso venne basato sulla codifica MPEG 
Audio Layer II, che a quei tempi rappresentava lo 
stato dell'arte; venne in seguito sviluppato il MPEG 
Audio Layer Ili (universalmente noto come MP3) 
che conquistò rapidamente il mercato della musica 
digitale. In tempi più recenti anche il mitico MP3 è 
stato superato in efficienza e livello di prestazioni da 
MPEG 4-AAC e ciò ha fatto sorgere l'esigenza di un 
aggiornamento della norma di codifica audio per il 
DAB allo scopo di ottenere maggior efficienza e ul¬ 
teriore riduzione del bit-rate; il DAB-e, standardizzato 
nel febbraio 2007 dall'ETSI (l'istituto europeo per 
la standardizzazione), prenderà il posto del DAB e, 
grazie all'adozione dell"algoritmo di compressione 
HE - AAC {High Effìciency Advanced Audio Codec) 
consentirà, a parità di qualità e di robustezza del 
segnale, di raddoppiare o addirittura triplicare il 
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numero dei programmi trasmessi in un singolo bou¬ 
quet, consentendo eventualmente l'inserimento di 
altri servizi radiofonici. 

Un'altra importante innovazione consiste nell'ag¬ 
giunta di potenzialità video multimediali al DAB ren¬ 
dendo quest'ultimo una piattaforma multimediale 
digitale sia radiofonica che televisiva mobile. DMB 
è il nuovo sistema di trasmissione per la radiofonia 
digitale basato sul DAB che consente di veicolare 
contenuti multimediali (audio, video e dati) ed, in 
particolare, anche immagini associate ai contenuti 
audio trasmessi da una emittente radiofonica. 

I segnali DAB/DAB-i- e DMB VR possono coesistere 
all'interno del medesimo multiplex e possono essere 
ricevuti da radioricevitori adatti a decodificare gli 
standard. 


Il risveglio di interesse da parte dei media per l'inno¬ 
vazione tecnologica nel comparto della radiofonia 
ci ha suggerito di dedicare questo numero della 
Rivista ad argomenti tecnicamente collegati con 
l'evoluzione del DAB che, per essere sfruttato al 
meglio, richiede nuove strategie per la generazione 
di programmi. 

Uno dei punti chiave nell'evoluzione della diffusione 
radiofonica è costituito dal suono multicanale: dopo 
anni di radio FM stereo, gli utenti potranno ascoltare 
programmi Surround 5.1 di qualità digitale. 

Parallelamente al miglioramento della qualità sog¬ 
gettiva percepita dall'utente si procede all'affina¬ 
mento delle tecniche di ripresa: due articoli trattano 
le problematiche della registrazione multicanale e 
dell'acustica architettonica. 

In particolare, il secondo articolo descrive la teoria 
su cui si basa il nuovo sistema di ripresa e registra¬ 
zione multicanale basato su 32 capsule posizionate 
su una sonda sferica e alcune applicazioni pratiche. 
Con questo sistema si possono sintetizzare in tempo 
reale fino a 7 microfoni virtuali potendo scegliere 
dinamicamente la loro direttività. 


La diffusione di 

Servizi Audio MPEG Surround 

su Radio Digitale 


Paolo Casagranda, 
Leonardo Scopece, 
Rai - Centro Ricerche e Innovazione Tecnologica 


1. Introduzione 


Lo standard DAB+/DMB si sta affermando in tutta 
Europa consentendo trasmissioni radiofoniche più effi¬ 
cienti e affidabili accanto a nuovi servizi basati su testo, 
immagini e dati. Uno dei punti chiave nell'evoluzione 
della diffusione radiofonica è il suono multicanale: dopo 
anni di radio FM stereo, gli utenti potranno ascoltare 
programmi Surround 5.1 di qualità digitale. 

Il presente articolo si propone di fornire una breve in¬ 
troduzione alla tecnologia audio multicanale, con parti¬ 
colare riferimento alla sua attuazione su Radio Digitale 
DAB-p. Conclude l'articolo una descrizione dei test di 
compatibilità con i ricevitori attualmente disponibili e 
una valutazione degli impatti sull'MPEG Surround sulla 
normativa per i ricevitori radio digitali europei. 


Sommario 

L'articolo affronta la tematica dell'audio 
multicanale sulla radio digitale. Viene 
brevemente descritta la tecnologia audio 
multicanale, con particolare riferimento 
alla sua attuazione su Radio Digitale 
DAB+. Sono inoltre riportati i risultati dei 
test di compatibilità con i ricevitori attual¬ 
mente disponibili, nonché considerazioni 
sulla attuale normativa europea. 
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2. Audio Multicanale 

Per un periodo abbastanza lungo il mondo dell'au¬ 
dio professionale non ha avuto sviluppi considere¬ 
voli, al contrario del video. 

L'immagine è sempre stata percepita come più ricca 
di informazioni ed emozioni, mentre il suono è stato 
da molti considerato subordinato prescindendo 
dalla sua qualità. 

Ma i prodotti radiofonici, con i loro effetti, le loro 
"ambientazioni", con i toni particolari dei dialoghi 
riescono a dare molte e forti emozioni, sicuramente 
più efficaci dell'immagine in parecchie circostanze. 
E' facile ricordare, ad esempio, le commedie ra¬ 
diofoniche, che ricche di effetti di ambiente, sulle 
voci degli attori, di simulazioni di immagini sonore 
non necessariamente presenti nel momento della 
registrazione e/o messa in onda, fanno sì che lo 
spettatore "viva" in prima persona la realtà che 
ascolta per radio. 

Finora tutto ciò è stato possibile producendo un 
segnale audio stereofonico. Dopo tanti anni, però, 
le tecniche e le tecnologie audio hanno avuto una 
spinta in avanti. Dalle tecniche di ripresa multimi- 
crofonica (che ancora oggi si utilizza soprattutto in 
ambiente televisivo), alle tecniche stereo con micro¬ 
foni stereo, si è arrivati alle tecniche multicanale che 
utilizzano sistemi microfonici multipli per ottenere 
più segnali audio. 

E'ormai una realtà la possibilità di creare un suono 
multicanale o, come si usa genericamente nomina¬ 
re, un suono surround, questo per far sì che l'ascol¬ 
tatore si senta sempre più immerso e partecipe nel 
mondo che sente: dall'ascolto di un concerto, ad 
uno sceneggiato radiofonico. 

Nuove tecniche si affacciano sullo scenario tecno¬ 
logico che permettono queste realizzazioni, e tra 
queste ricordiamo quella basata sul sistema 3DVMS 
con origine dalla teoria Ambisonic. Il sistema è stato 
brevettato dalla Rai Centro Ricerche e Innovazione 
Tecnologica e l'A.I.D.A., spin-off dell'Università di 
Parma [1,2]. 


Acronimi e sigle 

3D-VMS 

3D - Virtual Microphone System 

AAC+ 

Advanced Audio Coding (MPEG) 

AC3 

algoritmo di compressione (Dolby Digital) 

AIDA 

Advanced Industriai Design in Acoustic 

AES 

Audio Engineering Society 

ARD 

Associazione Radio Digitale 

BIFS 

Binary Format for Scenes (MPEG-4) 

DAB 

Digital Audio Broadcasting 

DMB 

Digital Multimedia Broadcasting 

DTS 

Digital Theater System 

EBU 

European Broadcasting Union 

ETSI 

European Telecommunications Standards 
Institute 

FM 

Frequency Modulation 

MPEG 

Movig Picture Experts Group 
(ISO/IEC JTC 1/SC 29/WG 11) 

SAC 

Spatial Audio Coding 
(MPEG ISO/IEC 23003-1) 

UDP 

User Data Protocol 

X-PAD 

eXtended Program Associated Data 


Il sistema 3D-VMS utilizza una sonda sferica di circa 
8,5 cm di diametro, sulla cui superficie si trovano 32 
capsule; questa è collegata con un cavo ethernet 
che può essere lungo fino a 140 m, ad un'interfaccia 
audio e ad un sistema di analisi e sintesi digitale 
frutto del brevetto. Dai 32 segnali "grezzi" ottenuti 
in ripresa, si possono sintetizzare fino a 7 microfoni 
virtuali per la ripresa in reai time e multipli di 7 in 
post-produzione, che possono essere disposti sulla 
scena in tutto lo spazio (360° sul piano e 180° in 
altezza) con una direttività che può andare dall'om¬ 
nidirezionale al direttivo più spinto detto di ordine 6. 
Un insieme di 7 segnali così ottenuti può poi essere 
"mappato"in surround o in qualunque altro modo 
attraverso un mixer o tramite l'interfaccia progettata 
per il sistema. 
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Si può quindi ottenere un segnale surround, che 
codificato opportunamente, può essere trasmesso 
sia su piattaforma internet sia via etere, ad esempio 
su piattaforma DAB+/DMB. Si noti che la maggior 
parte degli utenti ascoltano la radio in movimento, 
servendosi di un'autoradio o un dispositivo porta¬ 
tile. E la ricezione in movimento è il punto di forza 
delle reti DAB-h/DMB pienamente implementate. Per 
questo motivo il trasporto di segnali Surround su 
DAB-I-/DMB dovrà essere accompagnato da altri ac¬ 
corgimenti tecnologici, come la decodifica binaurale 
[3] per l'ascolto con cuffie o il posizionamento otti¬ 
male di diffusori e la riduzione del rumore nell'auto. 

Il Centro Ricerche Rai ha integrato un sistema per la 
trasmissione e ricezione di segnali MPEG Surround, 
su tutta l'area di Torino, a scopo sperimentale. In 
Italia non sono ancora presenti trasmissioni radio 
DAB-i- Surround commerciali. 


3. Descrizione del sistema MPEG Surround 

Il sistema proposto permette di trasmettere servizi 
MPEG Surround 5.1 sulla Radio Digitale [4,5,6]. Il 
sistema è stato integrato per la messa in onda di 
MPEG Surround sull'area di Torino. 

Come la radio in modulazione di frequenza (FM) 
aveva abilitato la trasmissione di segnali stereo 
analogici, così la Radio Digitale su DAB permette di 
raggiungere l'utente con segnali digitali Surround 
di elevata qualità, grazie alla tecnologia MPEG Sur¬ 
round [3,7] e allo standard di trasmissione DAB [9]. 

Lo standard MPEG-D [3] o SAC, consente la tra¬ 
smissione di un segnale Surround 5.1 multicanale 
aggiungendo una frazione della banda necessaria 
per una trasmissione tradizionale (overhead limita¬ 
to): tipicamente è sufficiente aggiungere il 10% del 
bit-rate totale di un canale stereo. 



Decodifica Legacy 



Parametri spaziali 


Fig. 1 - Architettura concettuale di un sistema MPEG Surround. 
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MPEG-D prevede infatti la codifica di N canali audio 
utilizzando M canali, in cui M<N; questa tecnica 
viene anche detta "matriciale" in quanto le tracce 
audio vengono combinate tra di loro per avere in 
uscita un numero inferiore di canali. 

Nel caso in esame, i 6 canali in ingresso vengono 
codificati utilizzando 2 canali audio e 1 canale 
aggiuntivo con i parametri di codifica spaziale. In 
questo modo è possibile trasmettere il canale ste¬ 
reo insieme ad un canale aggiuntivo di dati MPEG 
Surround. Si noti che la codifica è di tipo lossy (con 
perdita), che si serve di tecniche pisco-acustiche per 
ridurre il bit-rate. 

Un'altra caratteristica importante di MPEG Surround 
è che in linea di principio è possibile utilizzare 
qualunque tipo di encoder per la compressione 
dei canali audio principali (come si vede in figura 1 , 
il calcolo dei parametri spaziali avviene prima della 
compressione dei canali audio trasmessi). 

Si noti che MPEG Surround è quindi un sistema so¬ 


stanzialmente diverso, tra gli altri, dal Dolby Digital 
5.1, codificato con la tecnica AC3, che si limita a 
codificare i canali in modo indipendente. 

Il vantaggio consiste nella compatibilità con i ricevi¬ 
tori che non implementano MPEG Surround: questi 
ultimi decodificheranno un normale segnale stereo, 
ignorando i dati aggiuntivi MPEG Surround. 

Il consorzio WorIdDMB ha quindi standardizzato 
l'incapsulamento di MPEG Surround su DAB, DAB-i- 
e DMB [9]. La normativa prevede di trasformare i 6 
canali in ingresso in 3 canali: due di questi andranno 
a formare un servizio stereo, il terzo, a basso bit¬ 
rate, conterrà i dati relativi alla stima dei parametri 
spaziali. 

Una piattaforma reale che preveda la trasmissione 
di segnali DAB Surround può essere schematizzata 
come in figura 2. 

Si vede il "DAB Surround Encoder"con le 6 sorgenti 
in ingresso. L'uscita dell'encoder (generalmente 


Rete Aziendale 


A/V 

1-1264 Encoder 



Audio 

■W . 

ACC-t- Encoder 



Audio ^ 

Musicam Encoder 




Audio 1 


RS Surround Encoder AAC-i- 


Audio 6 


ETI lnserter_ 




Radioscape 
Service Monitor 


DAB/DAB+/DMB Mux 



Generazione Servizi 
Siide Sow, DLS, EPG 



Controiio 

Fig. 2 - Piattaforma per la trasmissione del segnale DAB Surround. 
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Fig. 3 - Encoder Surround RadioScape. 


su IP) raggiunge un Multiplexer, che provvede ad 
inserirla neN'ensemble DAB/DAB+/DMB. I canali 
audio in ingresso (6 in tutto) vengono analizzati 
dall'Encoder DAB Surround, che effettua un down 
mix producendo in uscita due canali con compres¬ 
sione AAC-f, con un bit-rate specificato e un canale 
dati a basso bit-rate con i parametri di codifica audio 
spaziale. L'encoder stabilisce anche quali sono i 
due canali principali: questi verranno riprodotti da 
qualunque ricevitore DAB-f, indipendentemente 
dalla sua compatibilità con MPEG Surround. Gli altri 
4 canali verranno inseriti parametricamente in un 
canale di dati che solo i ricevitori compatibili MPEG 
Surround decodificheranno (canale X-PAD). Tutti 
gli stream vengono quindi inseriti nell'insieme dei 
servizi della radio digitale (ensemble). L'ensemble 
viene quindi trasportato su ponte radio alla stazione 
di trasmissione, sul colle dell'Eremo, dove avviene 
modulazione e trasmissione sull'area diTorino. 

4. La soluzione utilizzata per i test su DAB-p 

L'encoder utilizzato per i test descritti in questo ar¬ 
ticolo è il RadioScape Surround Encoder. L'encoder 
permette di codificare segnali live, in tempo reale 
(figura 3). 

L'encoder permette di codificare un segnale audio 
su 6 canali (6 ingressi analogici bilanciati oppure 
digitali AES/EBU). Si è scelto questo dispositivo per 
la possibilità di integrazione con il sistema di test 
pre-esistente in uso al Centro Ricerche Rai. 

Quando sono stati eseguiti i test non esistevano, a 
conoscenza di chi scrive, ricevitori consumer DAB 
Surround. Una possibilità per la ricezione dei se¬ 
gnali DAB Surround è quella di utilizzare il ricevitore 
DAB Scout dell'IRT (Institut fur Rundfunktechnik) in 
associazione con un opportuno software di codifica 


DAB Surround. Un'alternativa, scelta per i test in 
questione, era l'utilizzo di un'unità di ricezione e 
test DAB RadioScape, come il RadioScape Service 
Monitor. 

5. Setup e test effettuati 

I test eseguiti hanno raggiunto due obiettivi: 

'4 La validazione del sistema end-to-end, con 
codifica, trasmissione, ricezione e decodifica di 
un segnale audio Surround 5.1 

'4 La verifica della compatibilità del sistema con i 
ricevitori pre-esistenti, che non implementano 
questa parte di standard. I ricevitori dovranno 
essere in grado di riprodurre un audio stereo. 

E'stato utilizzato un lettore DVD Blu-Ray Sony BDP- 
S550 con sei uscite analogiche, collegato al Radio¬ 
Scape Surround Encoder mediante gli ingressi ana¬ 
logici bilanciati di quest'ultimo. L'Encoder Surround 
è stato configurato per produrre uno stream di 128 
kbps, con due canali AAC-f stereo, e un canale di dati 
per la ricostruzione matriciale del segnale multica¬ 
nale. L'audio così codificato è stato incapsulato in 
pacchetti UDP (protocollo di trasporto su internet, 
unidirezionale) e inviato al Multiplexer DAB/DAB-f/ 
DMB, e da qui al ponte radio per la trasmissione 
sull'area di Torino. Al Centro Ricerche è stato poi 
equipaggiato il Radioscape Service Monitor con 
l'opzione Surround. Una scheda audio compatibile 
e un sistema di casse HomeTheater hanno com¬ 
pletato la postazione di ricezione. Il ricevitore è 
stato in grado di riprodurre correttamente i segnali 
trasmessi (figura 4). 

Per la verifica dell'interoperabilità con ricevitori 
pre-esistenti, era necessario verificare che anche un 
ricevitore DAB-f non abilitato MPEG Surround fosse 
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comunque in grado di riprodurre correttamente un 
audio stereo utilizzando i due canali principali. A 
questo scopo ci si è valsi di ricevitori handheld iRiver 
B20 e B30, di radio Pure Sensia e Pure Evoke-2S. I 
ricevitori, una volta sintonizzati sul canale DAB+ 
MPEG Surround hanno decodificato correttamente 
la parte stereo del segnale multicanale 5.1. 

6. Normativa 

Per valutare il possibile impatto del DAB Surround 
sul futuro mercato dei ricevitori DAB occorre ve¬ 
rificare la compatibilità di questo standard con i 
Profili per il ricevitore Radio Digitale Europeo stilati 
dal WorIdDMB in collaborazione con EBU e Digital 
Europe^°‘='[10]. 

Ogni profilo definisce un insieme minimo di requisiti 
e caratteristiche che servizi e ricevitori devono sod¬ 
disfare. Lo scopo dei profili è di rendere il mercato 
europeo di ricevitori e servizi di radio digitale ampio 
ma conservando l'interoperabilità fissato un profilo. 


Sono stati definiti 3 diversi profili, che si elencano in 
ordine di complessità crescente: 

• Standard Radio (Profilo 1): ricevitore audio di 
base, con display alfanumerico 

• Rich Media Radio (Profilo 2): ricevitore con 
display a colori almeno 320x240, può visualiz¬ 
zare immagini e supporta BIFS, utilizzato per la 
descrizione di elementi interattivi nell'immagine 

• Multimedia Radio (Profilo 3): ricevitore in grado 
di riprodurre correttamente anche il video 

I profili sono stati creati dal WorIdDMB e recepiti 
dalla EBU attraverso la Raccomandazione R 126 
del 2009. 

In Italia, oltre la piena approvazione dei profili euro¬ 
pei, l'Associazione per la Radio Digitale (ARD) con Rai 
Way in prima fila, ha creato una raccomandazione 
aggiuntiva (ARD-Book) che promuove la creazione 
di 3 bollini di certificazione per i ricevitori radio 
digitali, in sostanza suddividendo in modo piij fine 
i profili 1 e 2 della Raccomandazione EBU. 



Come si è visto, il DAB Surround è 
uno standard fin dal 2005 [7], e si 
basa sullo standard [3]. Il DAB Sur¬ 
round è compatibile con i profili di 
ricevitore del WorIdDMB, come ser¬ 
vizio opzionale, perché tale è l'audio 
multicanale nella normativa ETSI, si 
veda ad esempio [9]. I ricevitori che 
non implementano la specifica DAB 
Surround decodificheranno in modo 
trasparente un canale DAB/DAB-i-/ 
DMB stereo. Si tenga anche presente 
che tecniche di decodifica binaurale 
{binaural decodìng) permettono di 
ottenere anche con l'uso di cuffie, 
quindi in ricezione mobile, un nuovo 
livello di realismo sonoro. 


Nota 1 - Digital Europe: dal 2009 la 
nuova denominazione della European 
Information, Communications and 
Consumer Electronics Industry Tech¬ 
nology Association (EICTA). 
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7. Conclusioni 

Lo standard MPEG Surround rappresenta una tec¬ 
nologia matura e in linea con le raccomandazioni 
europee per i ricevitori di Radio Digitale. 

I test tecnici condotti dal Centro Ricerche su un 
sistema MPEG Surround su DAB-i- integrato per 
l'occasione ne hanno verificato il funzionamento. 

II sistema ha riprodotto correttamente un segnale 
MPEG Surround trasmesso dal Centro su tutta l'area 
di Torino. 

Inoltre è stata confermata la compatibilità del 
segnale DAB MPEG Surround con dispositivi pre¬ 
esistenti, caratteristica essenziale per una graduale 
introduzione in reti commerciali già esistenti. 

MPEG Surround è un passo ulteriore verso un servi¬ 
zio che metterà l'utente nelle condizioni di gradire 
e vivere con più intensità e più emozione ciò che 
viene ripreso e trasmesso. Quando il mercato offrirà 
ricevitori consumer in grado di ricevere i segnali 
surround da piattaforma DAB/DAB-i- e DMB l'utente 
potrà vivere con la radio momenti sonori di ottimo 
realismo. 
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3D - Virtual Microphone System 

Sonda Microfonica ad 
Elevata Direttività 


Leonardo Scopece, 
Rai - Centro Ricerche e Innovazione Tecnologica 


Angelo Farina, 
Andrea Capra 

Università di Parma - Dipartimento di Ingegneria Industriale 


1. Introduzione 


Un precedente articolo [1] illustra l'attività di ricerca 
avviata dal Centro Ricerche della Rai e dal Dipar¬ 
timento di Ingegneria Industriale dell'Università 
di Parma che ha portato alla progettazione e rea¬ 
lizzazione di un sistema di ripresa e registrazione 
basato sulla tecnica Ambisonic. Il sistema utilizza 
una sonda HOA ed è stato denominato 3D-VMS. I 
risultati conseguiti hanno consentito la definizione 
di un brevetto, depositato dalla Rai e da AIDA, spin- 
off dell'Università di Parma, 

Il sistema ideato sfrutta una sonda microfonica a più 
capsule per consentire una flessibilità di impiego 
nelle produzioni audio/video in campo broadcast 
non ottenibile con i modelli microfonici "discreti" 
disponibili sul mercato. 

I modelli microfonici discreti possono essere mon¬ 
tati direttamente su telecamera e il loro movimento 
può essere sincronizzato automaticamente al mo- 


Sommarìo 

Sono descritte la teoria del nuovo sistema di 
ripresa e registrazione multicanale basato su 32 
capsule posizionate su una sonda sferica e alcu¬ 
ne applicazioni pratiche. Con questo sistema 
si possono sintetizzare in tempo reale fino a 7 
microfoni virtuali potendo scegliere dinami¬ 
camente la loro direttività (partendo da un 
omnidirezionale, passando ad un cardioide 
standard e arrivando ad un cardioide di ordi¬ 
ne 6 ultradirettivo) e la loro posizione spaziale. 
Un'interfaccia grafica ne permette il posiziona¬ 
mento ed il movimento su un'immagine video a 
360°. Il sistema è basato su una nuovo approc¬ 
cio matematico al calcolo della matrice di filtri 
FIR da convolvere in tempo reale con il segnale 
proveniente dalle capsule microfoniche; il tempo 
di latenza è ridotto grazie ad un processore di con 
voluzione partizionato. 
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vimento camera, ma non sono in grado di zoomare 
nel campo sonoro. 

Il singolo microfono in posizione fissa restituisce 
come risultato una ripresa sonora "statica", che non 
corrisponde alla dinamica video correntemente im¬ 
piegata nel broadcast, dove l'immagine non rimane 
fissa per più di pochi secondi. 

Il sistema 3D-VMS consente una ripresa multimi- 
crofonica o, in alternativa, surround, consente di 
realizzare lo zoom microfonico in modo dinamico e 
d in tempo reale, consente di posizionare più punti 
di ripresa sul piano azimutale e mediano (fino a 7 
microfoni virtuali). 

Questo articolo aggiorna quello precedentemente 
pubblicato [1] fornendo ulteriori dettagli sulle basi 
di funzionamento del sistema e considerazioni 
sulle sperimentazioni in diversi ambienti e campi 
di applicazione. 

2. Microfoni virtuali 

Negli ultimi anni sono state avviate diverse attività di 
ricerca per sviluppare tecnologie atte a registrare e 
riprodurre le proprietà spaziali del suono. Molti de¬ 
gli approcci proposti fanno uso di grandi schiere di 
microfoni e altoparlanti per elaborare i segnali sulla 
base di teorie matematiche complesse, evoluzioni 
del classico principio di Huygens. 

Questi metodi si basano su rappresentazioni mate¬ 
matiche del campo sonoro, che viene decomposto 
in onde piane [2], in armoniche sferiche [3] o fun¬ 
zioni complesse di Hankel [4]. 

Qualunque metodo venga utilizzato, alla fine ci si 
può ricondurre al calcolo come sintesi di un numero 
di microfoni virtuali, ciascuno dei quali alimenta un 
altoparlante nel sistema di ascolto. 

L'approccio scelto non utilizza nessuna rappresen¬ 
tazione matematica del campo sonoro, vuole invece 
identificare una soluzione numerica in grado di 
ottenere direttamente i coefficienti dei filtri utili a 
sintetizzare ciascun microfono virtuale con diretti¬ 
vità e direzione di puntamento arbitrari. 


Acronimi e sigle 

3D-VIV1S 

3D - Virtual Microphone System 

ADAT 

in origine Alesis Digital Audio Tape, ora 
indica l’interfaccia ottica per il trasferimento 
dell’audio digitale (ADAT Optical Interface) 

AIDA 

Advanced Industriai Design in Acoustic 

CAT5 

cavo di CATegoria 5 per Ethernet 

CAT6 

cavo di CATegoria 6, adatto fino a 10-Gi- 
gabit Ethernet 

ESS 

Exponential Sine Sweep 

EMIB 

Eigenmike® Microphone Interface Box 

FFADO 

Free FireWire Audio Drivers 

FIR 

Finite Impulse Response 

GUI 

Graphical User Interface 

HOA 

Fligh Order Ambisonic 

MATLAB 

MATrix LABoratory, ambiente per il calcolo 
numerico e relativo linguaggio 

MIDI 

Musical Instrument Digital Interface 


Sebbene questo approccio possa funzionare, in 
linea di principio, con qualsiasi tipo di geometria 
della schiera di microfoni, si è deciso di sviluppare 
il sistema utilizzando una sonda microfonica sferica 
costituita da 32 capsule di elevata qualità, recente¬ 
mente disponibile sul mercato. 

I 32 segnali sono filtrati impiegando un potente 
processore di convoluzione, capace di sintetizzare 
in tempo reale fino a 7 microfoni virtuali e di defi¬ 
nire la loro posizione e direttività utilizzando come 
dispositivo di controllo un joystick o un mouse; 
la gestione del sistema da parte dell'operatore è 
facilitata dall'uso di una videocamera panoramica 
a grand'angolo e di una una interfaccia grafica di 
uso intuitivo. 

La gestione può avvenire in tempo reale e con bassi 
tempi di latenza durante un evento dal vivo. In 
alternativa, i segnali "grezzi" delle 32 capsule pos¬ 
sono essere registrati, insieme al video panoramico, 
consentendo la loro elaborazione e la sintesi dei 
microfoni virtuali in fase di post-produzione. 
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I microfoni virtuali sintetizzati possono essere alta¬ 
mente direttivi (con diagrammi polari costanti con la 
frequenza, e con apertura del fascio di ripresa molto 
definita come quella di un microfono"a fucile"); sono 
intrinsecamente coincidenti, in modo da miscelare i 
segnali senza problemi di comb-fìitering; è possibile 
muovere continuamente i microfoni sulla scena 
per seguire attori e/o cantanti, o per dare voce al 
pubblico presente. 

La registrazione di un concerto è solo uno dei possi¬ 
bili scenari in cui utilizzare questo schema; un altro 
fra gli scenari testati è quello teatrale. 

Un'attenta analisi delle prestazioni del nuovo si¬ 
stema microfonico ha mostrato che la risposta in 
frequenza, il rapporto segnale-rumore e la reiezio¬ 
ne del suono al di fuori del fascio di ripresa sono 
migliori di quelli ottenuti impiegando algoritmi 
di elaborazione tradizionali applicati agli stessi se¬ 
gnali d'ingresso, o di microfoni altamente direttivi 
dedicati. 

3. Descrizione del sistema 

3.1 Filtri digitali per microfoni virtuali 

Dato un array di trasduttori, si può utilizzare un set 
di filtri digitali per creare i segnali in uscita (figura 1). 
Nel nostro caso occorre convertire gli M segnali che 
arrivano dalle capsule in l/segnali corrispondenti ai 
microfoni virtuali desiderati: è necessario utilizzare 
una matrice M>^V di filtri FIR. 

Assumendox^ come segnali di ingresso di M micro- 
foni,y^come segnali di uscita di V microfoni virtuali 
e h^^\a matrice di filtri, i segnali elaborati possono 
essere espressi come: 

M 

m=\ 

Dove * rappresenta la convoluzione, e quindi cia¬ 
scun segnale del microfono virtuale è ottenuto 
sommando i risultati delle convoluzioni degli M 
ingressi con un opportuno set di M filtri FIR. 


M ingressi \/uscite 



Fig. 1 - Schema di elaborazione dei segnali. 


In via di principio questo approccio permette di 
sintetizzare microfoni virtuali aventi un pattern di 
direttività arbitrario. In pratica si è deciso, per ora, 
di sintetizzare microfoni virtuali a cardiode di ordine 
superiore indipendenti dalla frequenza, come mo- 



Fig. 2 - Diagramma polare di microfoni virtuali 
a cardioide di vari ordini. 
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strato in figura 2, e specificare la direzione di punta¬ 
mento in coordinate polari (azimuth ed elevazione). 

I coefficienti dei filtri h sono normalmente calcolati 
seguendo una delle complesse teorie matematiche, 
basate sulla soluzione dell'equazione d'onda [2,3,4], 
spesso sotto alcune semplificazioni, si assume che i 
microfoni siano ideali e identici. 

I criteri di progetto seguiti, invece, non sono basati 
sulla scelta di una teoria specifica: il set di filtri h 
sono derivati direttamente da set di misure, fatte 
all'interno di una camera anecoica. 

E' costruita una matrice di coefficienti di risposta 
all'impulso in base alle misure; la matrice inversa è 
calcolata numericamente (impiegando tecniche di 
approssimazione, come il metodo dei Minimi Qua¬ 
drati più la regolarizzazione); in questo modo le usci¬ 
te dell'array microfonico sono in linea di massima 
molto prossime alle risposte ideali. Questo metodo 
corregge anche deviazioni del trasduttore e artefatti 
acustici (schermatura, diffrazione, riflessione, ecc.). 

I dettagli matematici per il calcolo dei coefficienti 
dei filtri sono illustrati in [5]. 


3.2 II modello microfonico 

La sperimentazione descritta in questo articolo è 
stata realizzata usando l'array microfonico Eigen- 
mike™ prodotto dalla MH Acoustics [6]. 

Questa sonda microfonica (figura 3) è costituita 
da una sfera di alluminio, di raggio pari a 42 mm 
con 32 capsule di alta qualità posizionate sulla sua 
superficie; i microfoni, preamplifìcati e convertiti 
da analogico in digitale sono all'interno della sfera 
e tutti i segnali sono trasferiti all'interfaccia audio 
utilizzando un cavo CAT-6 e protocollo Ethernet 
basato su A-net. 

L'interfaccia audio è denominta EMIB: basata sul chip 
TCAT DICE II, opera con i sistemi operativi Windows, 
QSX e Linux utilizzando FFADQ. La scheda dispone 
di due uscite analogiche in cuffia, un'uscita digitale 
ADAT e una porta word clock per sincronizzarsi con 
apparati esterni. 

Il sistema è in grado di registrare 32 canali con una 
risoluzione di 24 bit, e con frequenza di campiona¬ 
mento di 44,1 0 48 kHz. 


Fig. 4-11 sistema microfonico nella camera anecoica. 
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Il controllo dei guadagni dei preamplifica¬ 
tori avviene attraverso il controllo MIDI; è 
stata sviluppata una GUI in linguaggio Py¬ 
thon per permettere un semplice controllo 
del guadagno in tempo reale, con nessuna 
latenza e nessuna interruzione. 

3.3 Caratterizzazione sperimentale 

DEL MODELLO 

Le misure dell'array microfonico sono state 
effettuate impiegando il metodo ESS, allo 
scopo di ottenere 32 risposte all'impulso 
per ciascuna direzione di arrivo del segnale 
test. 

Tali misure sono state effettuate all'interno 
di una camera anecoica, per evitare rifles¬ 
sioni indesiderate e per massimizzare il 
rapporto segnale/rumore. 

L'altoparlante e la camera anecoica sono 
state gentilmente forniti dalla Eighteen 
Sound di Reggio Emilia, che ha anche 
provveduto all'uso di un altoparlante di 
alta qualità per le misure, come mostrato 
in figura 4. 

Il sistema è stato ruotato lungo l'azimuth 
(di 36 passi) e in elevazione (di 18 passi) 
usando un'attrezzatura mobile per la rota¬ 
zione azimutale e una piattaforma girevole 
per l'elevazione. In questo modo si sono 
ottenute 36x18x32 risposte all'impulso, 
ciascuna di 2048 campioni (a 48 kHz). 


Risposta in diroziont di massima dirottMti |D*) ('3d6 70*) 



•180 -90 0 90 180 


Azimut {•] 


Fig. 5 - Cardioide del 3° ordine. 



Fig. 6 - Cardioide del 6° ordine. 


3.4 Sintesi e test dei microfoni virtuali 

Per ottenere la matrice di filtri è stato realizzato uno 
script MATLAB. 

La convoluzione della matrice dei FIR con i 32 segnali 
provenienti dalle capsule dell'array, deve fornire 
come uscite i segnali dei microfoni virtuali con le 
caratteristiche desiderate. Nelle figure 5 e 6 sono 
riportati risultati sperimentali che mostrano alcuni 
dei differenti profili di direttività ottenuti. 


3.5 Architettura e 

Interfaccia GraFica per l'Utente 

Affinché un sistema venga usato in produzioni 
broadcast deve essere molto "robusto", senza com¬ 
plessità non necessarie. Occorre disporre di un'ele¬ 
vata potenza di calcolo per generare ed utilizzare in 
tempo reale i filtri FIR con basso tempo di latenza. A 
tale scopo il sistema è dotato di un'unità di elabora¬ 
zione dei segnali dedicata, contenente una scheda 
madre mini-ITX molto potente con un processore 
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Fig. 7 - Componenti hardware del sistema, a Sonda microfonica, b interfaccia EMIB, c Unità di elaborazione dei segnali, 
d console di controllo (notebook), e dispositivo di puntamento (joystick); f cavo CAT 6, in questa applicazione può ope¬ 
rare fino ad una lunghezza di 140 m, g interfaccia ottica ADAT, h interfaccia firewire, i collegamento via cavo Ethernet 
CAT 5 o WiFi, I collegamento via cavo o wireless. 


f 

■ Interfaccia audio 
I (firewire) 
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FFADO 

driver firewire 



Socket 
TCP/l P 
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BruteFIR 

RealTime 

Convolver 

RealTime 
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controllo 


Filtri 
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I bflogic_em32.c 

Brute FIR 
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Y. 
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Segnali provenienti 
dalle capsule 
(32 canali) 
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al microfono virtuale 




(7 canali) 



Fig. 8 - Architettura software. 
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Quad Core. L'elaborazione dei dei segnali audio 
viene effettuata da questa unità. 

Per il controllo visuale delle caratteristiche di ogni 
microfono virtuale viene utilizzato un notebook 
comunicante con l'unità di elaborazione tramite 
rete IP; per modificare in tempo reale le direttività 
e gli orientamenti dei microfoni virtuali l'utente ha 
a disposizione un joystick o un mouse (figura 7). 

Lo schema in figura 8 rappresenta l'architettura soft¬ 
ware adottata nell'unità di elaborazione dei segnali. 

L'interfaccia utente è progettata allo scopo di se¬ 
guire gli attori o le sorgenti in movimento, dando 
modo di verificare la posizione dei segnali audio dal 
vivo. A questo scopo, la GUI (figura 9) permette di 
focalizzare i microfoni su uno flusso video partendo 
da una camera di sorveglianza panoramica, posta 
in prossimità della sonda microfonica. 

4. Esempi di applicazione e sperimentazioni 

Nell'articolo pubblicato l'anno scorso [1 ] sono elen¬ 
cate le tipologie di eventi in cui il sistema può essere 
applicato vantaggiosamente: ripresa di orchestra , 
ripresa di eventi sportivi, teatrali, televisivi, radio¬ 


fonici, di talk show e diffusione di una scena in un 
ambiente diverso da quello di ripresa. 

Nel corso degli ultimi mesi sono state effettuate 
numerose sperimentazioni, verificando le caratte¬ 
ristiche del sistema nelle varie condizioni di ripresa, 
produzione e post-produzione. In alcuni casi sono 
stati messi a confronto il sistema olofonico (micro¬ 
fono Holophone H2Pro), citato in [1] e oggetto di 
precedenti articoli, con il sistema 3D-VMS. 

4.1 Concerto presso Auditorium 

Una prova relativa alla ripresa di un concerto è stata 
effettuata presso l'Auditorium Rai a Torino (figura 
1 0). La prova comparativa fra la ripresa con microfo¬ 
no olofonico e sistema 3D-VMS è avvenuta nel corso 
delle prove generali di un concerto di Sostakovich. 

I due tipi di microfono sono stati posti su due aste, 
molto vicine tra loro. 

II risultato, con la posizione delle aste alle spalle 
del Direttore d'Orchestra, è risultato molto buono, 
presente e gradevole per entrambe le tipologie. 

Il prodotto registrato con il microfono olofonico è 
più"squillante", ma ciò non implica necessariamente 
maggior gradevolezza rispetto a quello ottenuto 



( EndAa ; 
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Azimut 
Eievation : 
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Fig. 9 - GUI. Si noti lo 
slider utile per regolare 
la trasparenza dei pun¬ 
tatori colorati sovrappo¬ 
sti all'immagine video. 
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Fig. 10 - Torino, 13 maggio 
2010. Concerto di musica 
classica presso Auditorium 
Rai. 


con il sistema 3D-VMS. E' stato notato in alcuni 
momenti una leggera controfase sul prodotto olo- 
fonico, assente nel caso del sistema 3D VMS. 

4.2 Concerto presso Studio Radiofonico 

La ripresa è avvenuta in occasione del concerto in 
ricordo del terremoto de L'Aquila "Per non dimenti¬ 
care", in uno Studio Radiofonico Rai. 

Anche in questo caso (figura 11) la sonda micro¬ 
fonica era posta al centro, alle spalle del Direttore 


d'Orchestra. Sulla stessa staffa erano disposti una 
telecamera per l'interfaccia di servizio del sistema 
3D-VMS ed il microfono olofonico. 

Il risultato sonoro è stato soddisfacente, anche 
grazie all'acustica dello studio ed alla presenza del 
pubblico, che ha costituito un buon assorbitore. 

Il giudizio sul confronto con il microfono olofonico 
è da considerarsi puramente soggettivo: il segnale 
olofonico è sembrato meno cupo dell'ambisonico, 
ma in generale meno soddisfacente. 
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4.3 Programma in 

Studio Televisivo 

La sperimentazione di ripresa ef¬ 
fettuata durante la realizzazione 
una puntata del programma Me- 
levisione (figura 12) ha ottenuto 
risultati poco significativi a causa 
della distanza a cui ci si è posti 
con la sonda per non intralciare 
il lavoro degli addetti, infatti la 
scenografia, tipica del format, oc¬ 
cupa la maggior parte dello spazio 
di scena. 

Malgrado le condizioni non favore¬ 
voli, il suono delle voci è risultato 
buono,ancheseinalcuni momenti 
"fuori fuoco". 



Fig. 1 2- Torino, 9 settembre 2010. Programma televisivo 
Melevisione presso Studio TV al Centro di Produzione Rai. 


4.4 Opera lirica:"La Bohème" al Teatro Regio 

Il sistema 3D-VMS è stato utilizzato nel corso delle 
prove generali, presente il pubblico, de "La Bohème" 
al Teatro Regio di Torino (figura 1 3). 

La sonda microfonica, per motivi di regia, è stata 
posta su un'asta davanti alla prima fila in platea, ma 
non in posizione centrale, leggermente spostata 
verso destra di circa 20° rispetto al centro, guardan¬ 
do il palcoscenico, con la fossa dei musicisti tra la 
sonda stessa ed il proscenio. 


La sperimentazione ha consentito di verificare la 
possibilità, in post-produzione, di "traslare" al cen¬ 
tro i 7 microfoni virtuali, mantenendo il rapporto 
spaziale tra loro. 

Dal punto di vista acustico non si è ottenuto un 
buon risultato perché le voci dei cantanti erano 
molto lontane e inoltre"disturbate"fortemente dalla 
musica proveniente dalla fossa. Solo nel caso degli 
assoli le voci era riprodotte in modo più pulito, pur 
risultando comunque troppo distanti. 



Fig. 13- Torino, 21 
maggio 2010. Un'imma¬ 
gine delle prove gene¬ 
rali dell'opera "Boheme" 
presso il Teatro Regio. 


22 


Elettronica e Telecomunicazioni N° 1 Aprile 2011 


www.crit.rai.it 






Fig. 14- Milano, 20 ottobre 2010. Il Piccolo 
Teatro e la scena di "Arlecchino, servitore di 
due padroni", registrato in 3D HDTV per il 
video e 3D-VMS per l'audio. 
Nella foto panoramica è visibile la sonda 
microfonica e valutabile la posizione inido¬ 
nea ad essa assegnata. 


4.5 Teatro: "Arlecchino" al Piccolo 

Purtroppo nel caso della ripresa di "Arlecchino ser¬ 
vitore di due padroni" al Piccolo Teatro di Milano è 
stato possibile posizionare la sonda solo in un luogo 
particolarmente infelice (figura 14): in galleria in po¬ 
sizione laterale, con una visione del palco veramente 
minima, con un'apertura di circa 10°. 

Il recupero dell'informazione sonora ha richiesto un 
impegnativo lavoro di post-produzione, durato più 
di due settimane. Il risultato ha superato le più ro¬ 
see aspettative, è stato possibile "estrarre"il parlato 
dei vari attori anche nelle condizioni più critiche (di 
schiena, lontani dal microfono, bisbiglio). 


4.6 Concerto in Sala del Conservatorio 

Durante il Concerto in re maggiore op.35 per violino 
e orchestra di Tchaikovsky (figura 15), l'asta con la 
sonda microfonica è stata posizionata al centro e 
alle spalle del direttore d'orchestra. 

Il risultato ottenuto è stato molto soddisfacente, 
ha richiesto pochissimo lavoro di post-produzione. 

Quando è possibile posizionare il microfono nel 
punto ottimale, frontale, si ottiene la miglior regi¬ 
strazione e l'effetto "pubblico" non risulta troppo 
disturbante. 



Fig. 15 - Torino, 22 novem¬ 
bre 2010. Concerto presso 
il Salone del Conservatorio 
Giuseppe Verdi. 
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Fig. 16- Milano, 27-28 febbraio 
el marzo 2011. Composizione 
"Mise en abìme" presso lo Studio 
3 del Centro di Produzione Rai. 
Nel riquadro il compositore, sulla 
sinistra, analizza le caratteristiche 
volute per la ripresa mediante il 
sistema 3D-VMS. 


4.7 Concerto IN Studio Televisivo 

"Mise en abìme"(in italiano"messa in abisso") è una 
composizione del M° Yuval Avital, creata per un 
organico strumentale e corale di massa, utilizza lo 
spazio come un elemento essenziale della partitura. 

La Rai, in accordo e in collaborazione con il Teatro 
Franco Parenti, con Magà Global Arts e l'Università 
di Milano, ha sperimentato l'uso del sistema 3D-VMS 
per riprendere questa particolare composizione. 

La ripresa sperimentale è stata effettuata allo Studio 
3 del Centro di Produzione Rai di Milano (figura 1 6). 

L'ensemble musicale, dispo¬ 
sto su una circonferenza, è 
particolarmente articolato e 
complesso composto da 32 
fisarmoniche, 2 fisarmoniche 
basse, 2 bassi tuba, 1 clarinet¬ 
to basso, 1 soprano, 1 percus¬ 
sione e 1 didgeridoo. Il coro è 
costituito da oltre 100 voci di 
non professionisti disposti su 
una circonferenza esterna ed 
esegue una partitura alfabe¬ 
tica e grafica. I direttori sono 
quattro, due per il coro e due 
per gli strumenti. 

La sonda microfonica è stata 
posta al centro delle due cir¬ 
conferenze. Inoltre, per avere 
un eventuale rinforzo sonoro, 
si sono utilizzati ulteriori 8 


microfoni cardiodi a copertura di una suddivisione 
ideale della scena in 8 settori. 

Dalle riprese è stato realizzato un prodotto quadri- 
fonico di buona qualità, obiettivo della sperimen¬ 
tazione. 

4.8 Opera lirica: "Nabucco" a Montecitorio 

Le condizioni di ripresa dell'opera il"Nabucco"pres- 
so la Camera dei Deputati di Montecitorio (figura 
1 7) e interpretata dall'Orchestra dell'Opera di Roma 
diretta dal Maestro Riccardo Muti non sono state, 
purtroppo, ottimali. 

Infatti non è stato possibile 
collocare la sonda microfo¬ 
nica al centro dell'Orchestra, 
come inizialmente si era ipo¬ 
tizzato, poiché l'asta avrebbe 
"impanato" la ripresa video. 
La sonda è stata pertan¬ 
to posizionata in galleria, 
ad una quindicina di metri 
dall'Orchestra, alle spalle del 
Maestro. 

Ouesta limitazione, aggiunta 
all'acustica non ottimale 
della Camera, è la causa del 
risultato non entusiasmante, 
con l'eccezione dei pieni di 
orchestra e del coro. 

Fig. 17- Roma, 22 marzo 
2011. Opera lirica "Nabucco" 
alla Camera dei Deputati. 
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4.9 Opera lirica:"Rigoletto"alTeatro Regio 

La sperimentazione basata sulla ripresa del "Rigo- 
letto"al Teatro Regio (figura 18) aveva l'obiettivo di 
valutare un'applicazione più articolata del sistema 
3D-VMS. 

E'stata utilizzata una sola sonda microfonica, posta 
all'inizio del proscenio e quasi al centro vicino alla 
buca del suggeritore, per ottenere la registrazione 
dei 32 canali. Nella fase di post-produzione sono 
stati sintetizzati 7 microfoni frontali, puntati verso i 
cantanti, e, a partire dalla stessa registrazione mul¬ 
ticanale, sono stati sintetizzati ulteriori 7 microfoni 


puntati in direzione opposta, verso l'orchestra. Al 
momento della pubblicazione di questo articolo, 
non è ancora stato analizzato il risultato, ma si hanno 
buone aspettative, sulla base della percezione in 
cuffia nel corso della ripresa. 

4.10 Opera lirica: "Traviata" al Teatro Regio 

Nel caso de "La Traviata" (figura 19) si sono uti¬ 
lizzate due sonde microfoniche: una nella stessa 
posizione utilizzata per il "Rigoletto", la seconda 
posizionata su un'asta dentro la fossa, alle spalle 
del Direttore d'Orchestra. Il risultato della ripresa 
non è ancora stato analizzato, ma si suppone, con 

questa configurazione, 
di poter ottenere una 
riproduzione meglio 
definita delle compo¬ 
nenti sonore, cantanti 
e orchestra. Sarà possi¬ 
bile valutare i possibili 
problemi di fase dovute 
alla miscelazione delle 
registrazioni provenien¬ 
ti dalle due sonde e le 
eventuali implicazioni 
sul prodotto finale. 

Fig. 1 9- Torino, 20 aprile 
2011. Opera lirica "La Travia¬ 
ta" al Teatro Regio. 
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5. Conclusioni 

L'obiettivo del progetto era la realizzazione di un 
sistema microfonico capace di sintetizzare un signi- 
fìativo numero di microfoni virtuali, per i quali fosse 
possibile modificare dinamicamente e in tempo 
reale posizione e direttività. Il sistema sviluppato 
consente la definizione di microfoni virtuali i cui 
diagrammi polari possono variare con continuità 
dalle tipologie standard (come ominidirezionale o 
cardiode) fino a cardiodi molto direttivi del 6° ordine, 
tipologia di direttività risultata più stretta di quella 
dei microfoni "a fucile". 

La metodologia di progetto adottata offre signifi¬ 
cativi vantaggi: 

la possibilità di operare in un ampio intervallo di 
frequenze, per una data dimensione della sonda; 

correzione delle differenze costruttive delle 
capsule; 

correzione parziale di artefatti acustici quali ef¬ 
fetti di mascheramento, diffrazioni e risonanze. 

Particolare attenzione è posta alle caratteristiche 
operative, specifiche per le applicazioni previste: 

la sonda microfonica è stata adattata apposita¬ 
mente alle specifiche indicate per uso broadcast: 
il colore non è riflettente alle luci di scena, è 
dotata di manico per renderne assimilabile l'uso 
a quello di un microfono, opera alla frequenza 
standard professionale pari a 48 kHz. 

'4 l'interfaccia utente (GUI) è di uso semplice. 

^4 è in corso l'unificazione delle due unità, quella 
di elaborazione dei segnali e quella di controllo 
(utilizzata per la registrazione e l'interfaccia 
utente); anche l'elaborazione sarà affidata al 
notebook (l'attuale unità di controllo) grazie 
all'incremento delle capacità di elaborazione 
delle CPU. 

'4 di conseguenza è facilitata la sincronizzazione 
della ripresa video di servizio (necessaria per 
il puntamento dei microfoni virtuali) e del 
time-code, indispensabile per le operazioni di 
produzione e post-produzione. 

Il sistema fornisce un approccio rivoluzionario alla 
ripresa del suono nel campo dei broadcaster e nelle 


produzioni di film e musica e le innovazioni previste 
comportano a breve il superamento delle attuali 
limitazioni, tipiche di un prodotto destinato alla 
sperimentazione, con miglioramenti significativi 
dal punto di vista operativo, tecnico e di ingombro. 

L'estesa gamma di sperimentazioni ha dimostrato 
che, grazie alla flessibilità operativa, può trovare 
applicazione in produzione ed in post-produzione. 
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Che cosa è, come funziona 

Lacustìca architettonica 

Allestimento interno 
degli ambienti 


1. Sistemi di diffusione e 

TRATTAMENTO ACUSTICO 

Molto spesso nella progettazione acustica di una 
sala non basta scegliere una pianta irregolare e 
dimensionare ad hoc i lati per creare le condizioni 
ottime per l'ascolto, ma è necessario agire in un 
secondo tempo per introdurre delle correzioni 
tecniche per veicolare le onde sonore in un certo 
modo e per equalizzare alcune gamme di frequenza 
specifiche, perché l'azione più o meno assorbente 
dei materiali non è sufficiente. 

Per questo motivo si ricorre all'utilizzo dei sistemi 
di diffusione e assorbimento, che possono essere 
semplici componenti da aggiungere come bass 
trap ("trappola" per le basse frequenze) o diffusori 
cilindrici, oppure vere e proprie realizzazioni costru¬ 
ite appositamente per ricreare sensazioni sonore 
particolari, come nel caso dei sistemi home theatre 
o dei sistemi surround professionali. 


Parte MI 


Leonardo Scopece, 
Alberto Ciprian 


Sommario 

Per poter arrivare ad ottenere un trattamento 
acustico completo, è necessario collocare nella 
sala dei componenti acustici. Spesso, tuttavia, 
si rischia di scegliere la tipologia errata otte¬ 
nendo un effetto insufficiente o comungue 
diverso dalle aspettative. Questo è il terzo di 
tre articoli riguardanti l'acustica architettonica 
e si occupa della descrizione dei vari tipi di 
componenti, analizzandone i pregi e i difetti a 
seconda del tipo di applicazione. Molte volte 
è necessario effettuare un'analisi teorica, in 
base alle conoscenze del comportamento fisico 
delle onde, sul posizionamento degli elementi e 
confrontare tale analisi con le applicazioni pra¬ 
tiche. Sono anche analizzati i sistemi surround, 
olofonico e ambisonico. 

In conclusione sono illustrati esempi di sistemi 
reali: l'Auditorium della Rai di Torino e la Casa del 
Suono dell'Università di Parma. 
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1.1 Componenti 

I componenti tecnici per agire sulla propagazione 
delle onde sonore sono di vario tipo, ma general¬ 
mente si possono distinguere in tre categorie: 

• diffusori (piani, curvi, di Schroeder) 

• basstrap 

• DaaD 

Ogni componente, ovviamente, è realizzato con un 
diverso tipo di materiale a seconda della funzione 
che deve svolgere. Ad esempio un diffusore curvo 
sarà costituito da un materiale meno assorbente 
rispetto a quello di un bass trap che ha il compito 
di assorbire le basse frequenze. 

1.1.1 Diffusori 

I diffusori sono componenti acustici basati gene¬ 
ralmente sulle leggi fisiche della riflessione delle 
onde e hanno lo scopo di diffondere il suono in 
determinate direzioni contribuendo all'aumento 
della qualità complessiva della stanza. 

Ne esistono tre categorie: 

diffusori piani: sono della tipologia più sempli¬ 
ce e sono costituiti essenzialmente da un piano 
di legno. Il loro comportamento è diverso a 
seconda della frequenza considerata, per questo 


motivo vengono definite due frequenze limite 
f e f. 

5 I 

Se si considera lo schema in figura 1, allora le 
frequenze limite valgono: 



7i 0 

+ B" ■cos'3 

V • 

--I-— 


U fj 
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--F — 

+ A" 


rj 



Alle alte frequenze, superiori a f, l'onda è 
trasmessa in modo speculare e il diffusore si 
comporta come se fosse di estensione infinita, 
neN'intervallo compreso tra le due frequenze 
limite si ha un'attenuazione di 3 dB/ottava, 
mentre alle basse frequenze, inferiori a f., si ve¬ 
rifica una diffrazione a causa di un'attenuazione 
che aumenta di 6 dB/ottava al diminuire della 
frequenza. Quando si analizzano frequenze 
superiori a f il pannello si comporta come se 
fosse un piano di larghezza 6 e di lunghezza A 
infinita. I valori s e rsono le distanze del pannello 
dalla sorgente e dal ricevitore, rispettivamente. 

diffusori curvi: sono realizzati utilizzando super- 
fici convesse in legno compensato o truciolato 
per diffondere il suono con angolo di irradiazio¬ 
ne crescente all'aumentare del raggio di curva- 
tora. Questi elementi fungono da assorbitori 
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nella gamma delle basse frequenze, mentre la 
porzione irradiata è praticamente uguale a 
quella incidente, ad esempio, su un angolo di 
circa 120° (figura 2a), mentre un diffusore piano 
irradia il suono con un angolo molto più stretto 
(circa 20°-figura 2b). 

Tutto ciò fa capire come generalmente si pre¬ 
feriscano i diffusori curvi sia nei piccoli che nei 
grandi ambienti. Le dimensioni del diffusore 
vanno sempre rapportate alla lunghezza d'onda 
del suono. 

diffusore di Schrceder. sono sistemi acustici 
passivi'^°*= ' molto efficienti, costituiti da superfici 
sagomate "a greca"con una profondità propor¬ 
zionale alla lunghezza d'onda di progetto (figura 
3), mentre le fessure devono avere una larghezza 
minore della metà della minima lunghezza 
d'onda d'interesse. 


Nota 1 - cioè, non contengono 
sistemi di altoparlanti. 





Fig. 3 - Schema e immagine del diffusore di Schroder. 


Il modello matematico su cui si basa l'idea di 
questi diffusori è quello della serie di residui 
quadratici, che si ottiene scegliendo un numero 
primo N, elevando al quadrato i numeri compre¬ 
si tra 0 e N-l e dividendo il valore ottenuto per 
N. La serie dei resti di ogni divisione costituisce 
la serie di residui quadratici. 

Per progettare un diffusore di Schrceder si de¬ 
vono seguire alcuni passi: 

1. si sceglie il campo di frequenza in cui si de¬ 
sidera lavorare per ottenere una diffusione 
uniforme definendo una frequenza inferiore f. 
e una frequenza superiore f ; 

2. si calcola il periodo da assegnare alla sequenza 
di fessure pari al numero primo più vicino al 
rapporto delle frequenze scelte in precedenza, 
quindi: 



/ 


3. si definisce una lunghezza d'onda di progetto 
A come la massima da diffondere: 

s 

■ / / 

4. si calcola la larghezza w delle fessure come: 

V 340 

w = -=- 

2 / 2 / 


5. infine si calcola profondità: 

, /i •5' 

a =——^ 

" 2N 

dove indica il valore n-esimo della sequenza 
di residui quadratici. 
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Fig. 4 - Esempio di bass traps angolari. 



Fig. 5 - Possibile collocazione in una sala prove. 



Fig. 6 - DaaD. 


1.1.2 Bass trap 

I bass trap (figura 4) sono classificate come assor¬ 
bitori acustici e sono utilizzati per ridurre in modo 
efficiente l'energia delle componenti del suono alle 
basse frequenze e per contrastare le risonanze. 

Come tutti i dispositivi di assorbimento acustico, 
anche i bass trap lavorano dissipando l'energia so¬ 
nora in calore per effetto dell'attrito. Grazie alla loro 
funzione vengono utilizzate soprattutto in ambienti 
in cui è necessario mantenere un suono chiaro e di 
ottima qualità, come ad esempio gli studi di regi¬ 
strazione e le regie audio. Generalmente vengono 
collocate in punti in cui si prevede la formazione di 
risonanze come gli angoli (figura 5). 

1.1.3 DaaD 

I DaaD'^°‘''^ (figura 6) sono dei sistemi acustici passivi 
(che non hanno quindi un'amplificazione interna) 
che permettono di equilibrare il suono in base 
all'utilizzo scelto per la sala e al tipo di resa acustica 
che si vuole ottenere. 

Ciò è reso possibile dal fatto che ogni DaaD è for¬ 
mato da un lobo diffondente, mentre gli altri sono 
tutti assorbenti. In questo modo è possibile ruotare 
il dispositivo al fine di ottenere particolari effetti e 
un miglior controllo del suono alle varie frequenze 
senza dover ricorrere ad altri sistemi di trattamento 
acustico. Questi sistemi possono quindi considerarsi 
come un'evoluzione e un miglioramento di sistemi 
come i bass trap. 

II loro rendimento è dovuto in gran parte alla tipo¬ 
logia di materiali di cui sono composti: la superficie 
esterna è formata da lastre di lamierino microforato, 
in modo tale da permettere alle onde sonore di 
entrare all'interno del dispositivo, in cui incontrano 
del materiale fonoassorbente. 

Il funzionamento è basato sulla differenza di pressio¬ 
ne che si crea tra l'interno e l'esterno del dispositivo 
nel momento in cui all'interno dell'ambiente in cui è 
posto il DaaD viene riprodotto un suono. Questa dif¬ 
ferenza, a sua volta, provoca uno spostamento d'aria 
all'interno del DaaD e, a causa dell'attrito prodotto 
dai materiali resistivi, viene ridotta l'energia sonora. 

Nota 2 - Diffusion Absorption Acoustic Devices. 
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Ne esistono tre tipologie differenti (DaaD 2, DaaD 
3, DaaD 4), che si differenziano in base alla gamma 
di frequenze che trattano e alla loro dimensione. 
In particolare: i DaaD 2 funzionano per risonanze 
superiori a 120 Hz, i DaaD 3 per risonanze superiori 
a 70 Hz e i DaaD 4 per risonanze superiori a 50 Hz. 

Un altro aspetto che non deve essere trascurato è 
il posizionamento all'interno dell'ambiente. Infatti, 
essi agiscono sulla pressione sonora, quindi vanno 
collocati nei punti in cui la pressione stessa assume 
valori molto alti, come, ad esempio negli angoli e 
vicino a componenti come un subwoofer. Normal¬ 
mente, per un ambiente di medie dimensioni ne 
servono almeno 10^12, montati a colonna negli 
angoli. Ovviamente, volendo realizzare un tratta¬ 
mento ancora più efficace, ma molto più costoso, è 
possibile disporne un certo numero lungo le pareti, 
sempre controllandoli in punti in cui si concentra la 
pressione, perché se da un lato il grande vantaggio 
dei DaaD è quello di non colorare il suono, è anche 
vero che un errato posizionamento provoca un 
trattamento di scarsa qualità che ha come unico 
risultato un peggioramento della resa acustica. 


1.2 Posizionamento dei componenti 

IN BASE ALLE SORGENTI VIRTUALI 

Il posizionamento dei vari componenti, i DaaD, nella 
stanza può essere studiato considerando, insieme 
ai metodi visti in precedenza, anche la teoria delle 
sorgenti virtuali. 

Secondo questa teoria è possibile localizzare in 
modo abbastanza preciso quali zone delle pareti di 
una stanza sono interessate dalle onde propagate 
dalle sorgenti. Questo dato è molto importante per 
capire sia dove posizionare i componenti, ma anche 
peravere idea del numero di componenti necessari. 

Il principio che sta alla base della teoria sostiene di 
considerare ogni parete come un asse di simmetria, 
in modo tale da riflettere ogni sorgente rispetto 
a tutte le pareti. Successivamente si traccia una 
linea di collegamento verso il punto di ascolto e 
si considera la copertura. Effettuando lo stesso 
procedimento per tutte le sorgenti virtuali si ottie¬ 
ne la copertura generale sulle pareti. In figura 7 è 
rappresentato l'esempio di una stanza in cui è stato 
realizzato un sistema di diffusione multicanale. I 
rettangoli al centro rappresentano la zona d'ascol¬ 
to attorno alla quale sono collocati gli altoparlanti 
reali. Le zone colorate sulle pareti indicate sulle 
pareti rappresentano i punti in cui vanno collocati 
i componenti (distanziati tra loro di circa 40 cm), il 
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1.3 Sistemi Surround 

Rappresentano l'evoluzione dei sistemi di diffusione 
stereo, i quali sono in grado di riprodurre soltanto 
due canali (destro e sinistro). I normali sistemi ste¬ 
reo lasciano un "buco" al centro del fronte sonoro, 
che viene però ricostruito virtualmente dal cervello 
dando un'immagine fantasma. É però da notare 
che essendo un fenomeno psicoacustico, l'imma¬ 
gine fantasma tende a spostarsi in funzione della 
posizione dell'ascoltatore. Per ovviare a questo 
inconveniente e per fare in modo di ricreare una 
scena sonora il più possibile immersiva, sono stati 
sviluppati sistemi surround, cioè tecnologie in grado 
di distribuire il suono attorno all'ascoltatore utiliz¬ 
zando un certo numero di altoparlanti a seconda del 
formato. I formati più diffusi sono il 5.1 e il 7.1, dove 
il primo numero indica la quantità di altoparlanti, 
mentre il numero dopo il punto indica la presenza di 
un elemento dedicato alla riproduzione delle basse 
frequenze (il subwoofer). 

In questo modo è possibile inviare diversi tipi di 
segnale alle varie casse. Ad esempio, la riproduzione 
di film prevede la presenza di segnali corrispon¬ 
denti a dialoghi principali, che vengono inviati al 
canale centrale, segnali legati alla musica ed effetti 
particolari, che vengono inviati alle casse laterali, e 
segnali corrispondenti a effetti secondari e rumo¬ 
ri, che vengono inviati anche ai canali posteriori. 
Tutte le componenti a bassa frequenza (<110 Hz) 
vengono riprodotte dal canale LFE'^°*^^ Nel caso 
della riproduzione di eventi reali registrati, questi 



sistemi permettono una totale immersione nella 
scena, tutto dipende in realtà anche dalla qualità 
della registrazione (ottima nei casi di utilizzo ad 
esempio di una sonda VMS 30’^°*='* o un microfono 
per Colofonia). 

Il posizionamento delle casse, la loro distanza 
dall'ascoltatore e la loro altezza non è casuale, ma 
è standardizzata dalla norma ITU-R BS 775: 

l'altezza della cassa deve essere di 1.20 m in 
modo da essere all'incirca coplanare con le 
orecchie dell'ascoltatore; 

la distanza dall'ascoltatore può essere scelta 
tra due opzioni: 2.4 m (casse anteriori) e 1.8 m 
(casse posteriori), oppure 3.5 m (casse anteriori) 
e 2.4 m (casse posteriori); 

'4 gli angoli con cui orientare le casse sono invece 
schematizzati in figura 

Nota 3- LowFrequencies Emitter. 

Nota 4 - VirtualMicrophone System 3D. Sonda 
formata da 32 capsule disposte su una sfera, 
equispaziate dal centro e posizionate secondo 
un certo valore di azimuth ed elevazione. I 
segnali acquisiti dalle capsule vengono pre¬ 
amplificati, codificati, multiplexati ed infine 
inviati tramite un cavo ethernet a un'interfaccia 
collegata a un computer al fine di sintetizzare 
più microfoni virtuali, i quali in fase di post¬ 
produzione possono essere modificati al fine di 
aumentarne la direttività. 

Nota 5 - per semplificare la rappresentazione 
grafica le casse vengono disposte attorno a 
una circonferenza. 


2-4 m 



b) 

Fig. 8 - Orientamento delle casse nei sistemi 5.1 (a) e 7.1 (b). 
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1.4 Sistema di diffusione Ambisonics 

Il sistema Ambisonic'^°‘=® consiste in una metodica 
di spazializzazione sonora, che comprende sia 
tecniche di ripresa e registrazione del suono che 
procedure di mixaggio e riproduzione. Si basa sulla 
creazione, nella zona di ascolto, di un campo sonoro 
il più possibile uguale a quello originale e in grado 
di riprodurre le stesse sensazioni psicoacustiche 
(ambiente, distanza, posizione e timbrica) che si ha 
ascoltando direttamente l'evento originale. Cono¬ 
scendo infatti le informazioni relative alla pressione 
e alla velocità delle particelle d'aria in un determina¬ 
to punto, è possibile ricostruire fedelmente il campo. 

Le caratteristiche direzionali del campo acustico 
vengono ricostruite sommando le componenti 
armoniche sferiche del campo stesso, ognuna del¬ 
le quali viene acquisita tramite un microfono con 
uguali caratteristiche di direttività. 

A questo scopo esistono diverse tecnologie di acqui¬ 
sizione del segnale, tra cui: le sonde microfoniche 
Soundfield, Tetramic e più recentemente anche la 
sonda VMS 3D. 

Dalla teoria psicoacustica si ricava che per frequenze 
minori di 700 Hz il meccanismo dominante di loca¬ 
lizzazione sonora è la differenza di fase tra i segnali 
alle due orecchie, mentre alle frequenze medio-alte 
(700 Hz ^ 5 kHz) è dominante la loro differenza ener¬ 
getica. Le informazioni sulla spazialità del campo 
acustico sono codificate, in fase di ripresa, tramite i 
segnali corrispondenti alla pressione e alla velocità 
delle particelle d'aria nel punto in cui è posta la 
sonda acustica. Per una ricostruzione solamente 
bidimensionale sono necessari almeno tre alto- 
parlanti, mentre una riproduzione tridimensionale 
ne richiede almeno quattro. Le configurazioni di 
ascolto possono essere di diverso tipo con, ad 
esempio, quattro altoparlanti disposti ai vertici di un 
quadrato centrato sulla posizione d'ascolto (per una 
resa bidimensionale), oppure otto sistemati ai vertici 
di un cubo (per una restituzione tridimensionale). 


In linea teorica la posizione ottimale dell'ascoltatore 
non è ristretta ad un punto, ma risulta essere estesa 
a una determinata porzione di spazio. 

PRO: 

© semplice sistema di registrazione'^°‘^^; 

©indipendenza del sistema di codifica da 
quello di decodifica (riproduzione) con array 
di altoparlanti. 

CONTRO: 

@ le sorgenti irradiano soltanto onde piane; 

® gli altoparlanti devono essere sufficientemente 
lontani dall'ascoltatore (questo è un problema 
non trascurabile in ambienti di piccole dimen¬ 
sioni). 

1.5 La restituzione Ambisonic 

La restituzione del segnale codificato B-format viene 
effettuata eseguendo apposite operazioni algebri¬ 
che dei canali W, X, Y e Z, che sono ricavate in base 
ai principi generali della teoria della localizzazione 
sonora per ciascuna configurazione di riascolto. 
Un esempio può essere sviluppato considerando 
un insieme di otto altoparlanti disposti ai vertici di 
un cubo e diretti verso l'ascoltatore posizionato al 
centro della struttura (figura 9). 


Nota 6 - Non esiste una vera spiegazione del ter¬ 
mine Ambisonic. Dal punto di vista etimologico si 
potrebbe pensare come l'unione dei termini latini 
ambo (ambipolare) e sonus (suono), facendo quin¬ 
di pensare alla possibilità del sistema di basarsi 
sulla teorie legate alla psicoacustica e alla spazia¬ 
lizzazione del suono. Tuttavia ambo può anche far 
pensare al termine inglese ambient (ambiente), 
rimandando nuovamente all'idea della ricreazione 
del campo sonoro. Sempre ambo può far riferi¬ 
mento ai due parametri su cui si fonda la teoria: 
pressione e velocità delle particelle d'aria. 

Nota 7 - una possibile soluzione consiste nell'uti- 
lizzare più microfoni (minimo quattro) disposti 
nello stesso punto, posizionati al centro della scena 
acustica. 
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Fig. 9 - Configurazione minima per l'ascolto 3D. 

Per questa configurazione le formule algebriche 
sono le seguenti: 

Sgnì = G„-W + G^-X + G^-Y + G^-Z 
Sgn2 = G^-W + G^-X-G^-Y + G^-Z 
Sgn3 = G^,-jr + G^-X + G^-Y-G^-Z 

Sgn8 = G„-W-G^-X-G^-Y-G^-Z 
dove G^, G^, G^, G^ sono termini di guadagno 
introdotti per ottimizzare la resa del sistema. 


Funzione Delta Rumore Bianco 

di Dirac n(t) 

a(t) 


Filtro passa-basso Filtro passa-alto 



Sequenza da convolvere 
Fig. 10 - Schema della creazione dei segnali. 


Nonostante l'uso di tali coefficienti, le immagini 
sonore prodotte appaiono inizialmente piuttosto 
instabili e la zona d'ascolto molto limitata nei pressi 
del centro del cubo. 

Queste disomogeneità vengono attribuite ad inter¬ 
ferenze e conseguenti cancellazioni in determinate 
porzioni della zona d'ascolto, dovute in gran parte 
alla parziale coerenza dei segnali provenienti dagli 
altoparlanti che sono sempre somme algebriche 
diW,X,YeZ. 

Per rimuovere questo inconveniente si è deciso di 
rendere casuali le fasi dei segnali che alimentano le 
casse, per far sì che, nella zona d'ascolto, l'energia 
risultante sia equivalente alla somma algebrica dei 
segnali. Questa operazione però riguarda solo lo 
spettro delle medie e alte frequenze (sopra i 700 
Hz), poiché a frequenze inferiori è proprio la fase 
a stabilire la localizzazione e pertanto non deve 
essere alterata. Per garantire gli effetti desiderati 
vengono creati otto segnali differenti secondo lo 
schema in figura 10. 

Ciascuno di questi segnali consiste nella somma 
degli altri due: il primo {A) contiene solo le frequenze 
inferiori a 700 Hz, mentre il secondo (B) contiene 
solo le frequenze maggiori. In particolare, il segnale 
6 si ottiene filtrando con un filtro passa-alto un breve 
segmento di rumore bianco e possiede, in virtù delle 
proprietà del rumore bianco, valori di fase casuali. 
Il segnaleTl, invece, si ottiene filtrando con un filtro 
passa-basso una funzione impulsiva (la delta di 
Dirac) e ha fase costante sotto i 700 Hz. Ciascuno 
degli otto segnali ottenuti viene convoluto con una 
delle tracce di restituzione e questo comporta un 
significativo aumento della fecalizzazione e fecaliz¬ 
zazione delle immagini sonore, lasciando inalterata 
la zone utile d'ascolto. 

1.5.1 Posizionamento degli altoparlanti 

Uno dei maggiori vantaggi dell'Ambisonic consiste 
nel fatto che la parte di codifica è assolutamente 
indipendente dalla fase di ripresa; questo consente 
quindi una grande libertà di scelta sul numero di 
altoparlanti da utilizzare. Gli effetti che possono 
variare aumentando o diminuendo il numero di 
altoparlanti sono principalmente due: il senso di im- 
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mersione nella scena sonora (che aumenta quanto 
più è fedele e precisa la registrazione) e l'ampiezza 
dell'area d'ascolto (l'uso di molti altoparlanti garan¬ 
tisce un ascolto più realistico dovuto all'impressione 
di avere un'unica sorgente distribuita spazialmente). 

Questi due parametri sono fondamentali per un 
sistema come Ambisonic, il quale ha come obiettivo 
la ricreazione tridimensionale della scena sonora. 
Come detto il numero di altoparlanti varia molto 
in funzione del tipo di resa sonora che si vuole 
ottenere e soprattutto alle dimensioni della stanza 
in cui effettuare la riproduzione. Questo ultimo 
punto rappresenta un elemento molto importante 
soprattutto quando si considerano stanze di piccole 
dimensioni e quindi quando è necessario valutare 
attentamente il comportamento acustico dell'am¬ 
biente in termini di riflessioni e risonanze. Per una 
buona resa gli altoparlanti devono essere collocati 
a distanza adeguata dalla posizione in cui si trova 
l'ascoltatore (circa 2 m). 


Nel caso si voglia ottenere un effetto 2D il nume¬ 
ro minimo di altoparlanti è quattro, mentre nel 
caso si voglia un effetto 3D il numero minimo di 
altoparlanti è otto, considerando l'ascoltatore al 
centro di un cubo con gli altoparlanti posizionati 
in prossimità degli otto vertici (figura 11). Risulta 
inoltre molto vantaggioso agganciare (e non fissare) 
gli altoparlanti al muro, soprattutto in situazioni 
sperimentali in cui è necessario modificare in tempo 
reale la configurazione della stanza per effettuare 
misurazioni e test. 

1.6 Colofonia 

Colofonia è una tecnica di registrazione e riprodu¬ 
zione sonora eseguita tramite un microfono, olo- 
fonico, il quale permette di riprodurre un suono in 
modo molto fedele rispetto all'originale. In fase di 
riproduzione il suono viene percepito nelle esatte 
coordinate spaziali di registrazione. In questo modo 
è possibile localizzare la provenienza di un suono in 
tutto lo spazio tridimensionale in modo accurato. 


4 


•? 


Fig. 11 - Possibile configurazione. 
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La ripresa viene effettuata tramite un microfono olo- 
fonico'^°*=® il quale è formato da sette capsule loca¬ 
lizzate esternamente sul perimetro del supporto (la 
testa) più una capsula interna in grado di catturare 
le basse frequenze, ottenendo sistemi 5.1,6.1 o 7.1. 

In uscita un Holophone ha otto cavi bilanciati orga¬ 
nizzati come in tabella: 


Canale 

Microfono 

1 

Left 

2 

Right 

3 

Center 

4 

LFE 

5 

Left Surround 

6 

Right Surround 

7 

Top 

8 

Center Rear 


Bisogna fare attenzione a distinguere un sistema 
surround da un sistema olofonico: un sistema sur¬ 
round non è in grado di far giungere all'ascoltatore 
i suoni provenienti da qualsiasi punto dello spazio 
tridimensionale, cosa che invece un sistema olofo¬ 
nico riesce a fare. 

È da notare, tuttavia, come in commercio sia ancora 
difficile trovare casse acustiche in grado di ripro¬ 
durre in modo fedele l'olofonia (solo ultimamente 
si stanno diffondendo), perciò l'ascolto si può fare 
quasi esclusivamente tramite l'utilizzo di cuffie. 

Nota 8 - il microfono considerato è 

l'H2 PRO della Holophone. 


2 Casi di studio 

2.1 Auditorium Rai - Torino 

L'Auditorium Rai (figura 12) rappresenta uno dei 
luoghi di riferimento diTorino per quanto riguarda 
la riproduzione della musica sinfonica, e non solo, 
grazie sia al contributo dell'Orchestra Sinfonica 
Nazionale della Rai, ma anche grazie alla qualità 
dell'ascolto che è possibile percepire all'interno 
della sala. 

Durante la ripresa audio/video delle prove generali 
di un concerto di musica sinfonica, tenutasi il 13 
maggio 2010 presso l'Auditorium, è stato possibile 
osservare la struttura interna e valutare realmente la 
qualità dell'ascolto. Come si può notare dall'immagi¬ 
ne di figura 13 il palco è diviso in due parti sfasate in 
altezza. Nella parte inferiore è presente l'orchestra, 
mentre in quella superiore viene collocato, a secon¬ 
da delle occasioni, il coro. Questa disposizione non 
è casuale, infatti, collocare nella parte superiore il 
coro permette di fare in modo che il suono prodotto 
dall'insieme degli strumenti non mascheri quello 
del coro. Da notare è la disposizione di una serie di 
diffusori in legno collocata posteriormente all'or¬ 
chestra che permette di aumentare la diffusione del 
suono nell'ambiente senza disturbare la percezione 
del suono per i musicisti. 



Fig. 13 - Ripresa senza coro. 


Fig. 12 - Auditorium Rai -Torino. 
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Inoltre, sopra il palco, appesi al 
soffitto, sono stati posizionati sedici 
diffusori arcuati, disposti in due file da 
sei e una da quattro (figura 1 4). Questa 
disposizione ha una duplice funzione: 

• dividere lo spazio tra il pavimen¬ 
to e il soffitto in modo da evitare 
l'effetto eco, che, come detto, si 
crea se c'è uno spazio maggiore 
di 17 m; 

• permettere la diffusione omoge¬ 
nea del suono verso il pubblico 
posto nelle balconate e al fondo 
della sala. 



Fig. 15 - Riflessioni centrali 


Per quanto riguarda la scelta dei materiali per la 
progettazione acustica, sono stati utilizzati mate¬ 
riali in grado di favorire al massimo la diffusione, 
cercando di evitare, soprattutto sul palco, un alto 
assorbimento del suono. Per le sale da concerto è 
necessario ottenere una certa quantità di risonanza, 
che ovviamente varia a seconda del genere musica¬ 
le. Sul palco sono stati, quindi scelti materiali come 
il legno, per il pavimento e la parete retrostante l'or¬ 
chestra, e l'intonaco per i muri perimetrali dell'intero 
Auditorium. 

Per la platea e balconate sono stati utilizzati mate¬ 
riali come il velluto sulle poltrone, che permette di 
assorbire in quantità adeguata il suono prodotto. 
Infatti, nella progettazione acustica e nella scelta del 


tipo di materiali per ambienti di questo tipo, risulta 
fondamentale considerare il tempo di riverbera¬ 
zione "a vuoto"della sala, ma anche con il pubblico 
all'interno, in quanto ogni persona contribuisce ad 
aumentare l'assorbimento acustico totale della sala. 

Per valutare la qualità dell'ascolto durante la ripro¬ 
duzione dei brani musicali è stato utile spostarsi 
in due punti precisi della platea: al centro e a lato. 

Come è facile prevedere, il punto in cui la qualità 
dell'ascolto risulta migliore è al centro, in quanto il 
ritardo tra l'onda diretta e le riflessioni laterali (che 
arrivano in contemporanea e con lo stesso valore di 
attenuazione) è minimo (figura 15). 
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Lateralmente, invece, la sensazione acustica varia 
leggermente e il suono appare più cupo. Questo 
fondamentalmente per il fatto che la fila laterale 
si trova sotto la balconata e vicino a dei pilastri; in 
questo modo l'energia dell'onda diretta si somma 
a quella dell'onda riflessa e diffratta alle basse fre¬ 
quenze, creando quindi un raddoppio dell'energia 
stessa, e provocando la sensazione di un suono più 
cupo (figura 16). 


L'onda che viene riflessa dalla parete 
più lontana deve compiere un per¬ 
corso nettamente più lungo di quella 
riflessa dalla parete opposta, oltre 
al fatto che viene attenuata quasi 
completamente prima di arrivare al 
punto di ascolto (soprattutto nel caso 
in cui la sala sia piena). 

2.2 Casa della Suono - Parma 

La Casa del Suono di Parma (figura 
1 7) è un ambiente realizzato all'inter¬ 
no dell'ex chiesa di Santa Elisabetta 
con l'intento di essere sia museo, 
sia progetto multidisciplinare che la 
Casa della Musica dirige in collabora¬ 
zione con l'Università di Parma. Al suo interno, oltre 
a contenere una collezione di strumenti di diffusione 
dagli anni'20 fino a oggi, offre la possibilità di effet¬ 
tuare delle prove di ascolto utilizzando sistemi di 
diffusione innovativi quali il lampadario sonoro e la 
sala bianca, allestita con un sistema di diffusione sur¬ 
round basato sulla Wave Field Synthesis (WFS)'^°*^®. 

Nota 9 - tecnica che permette di creare ambienti acu¬ 
stici virtuali. Si producono fronti d'onda artificiali sinte¬ 
tizzando un certo numero di altoparlanti. A differenza 
di altre tecniche la localizzazione delle sorgenti virtuali 
non dipende dalla posizione dell'ascoltatore. 
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Il lampadario sonoro (figura 18) è un'installazione 
che permette di creare sorgenti virtuali in movi¬ 
mento sopra l'ascoltatore attraverso l'uso della 
Wave Field Synthesis, formata da 224 altoparlanti 
disposti in 64gruppi alimentati da 64canali audio. Il 
sistema è gestito da un elaboratore centrale che usa 
un software creato ad hoc, da un'interfaccia audio 
che consente di utilizzare 64 canali audio digitali in 
uscita, 8 convertitori digitale/analogico da 8 canali 
ciascuno e da altrettanti amplificatori a 8 canali, per 
un totale di 64 canali analogici finali. Camminando 
al di sotto del lampadario è effettivamente possibile 
percepire l'ampiezza del cono sonoro e discriminare 
le varie sorgenti, ottenendo come effetto comples¬ 
sivo una buona sensazione di immersione nella 
scena sonora. É da notare come questa sensazione 
sia favorita dal fatto di posizionare gli altoparlanti 
con un angolo di curvatura tale da fare in modo che 
il punto di intersezione delle onde si crei al di sopra 
della testa dell'ascoltatore, ponendo l'ascoltatore 
stesso completamente all'interno del cono sonoro. 

La sala bianca, (figura 1 9) è un ambiente che ospita 
un sistema surround avanzato basato anch'esso 
sulla Wave Field Synthesis e gestito da un software 
apposito per questa applicazione. Questo sistema 
permette di ricreare un campo sonoro sfruttando un 
anello di 189 altoparlanti full-range disposti lungo il 
perimetro della stanza a 1.50 m di altezza. 

Dagli ascolti effettuati all'interno si è potuto veri¬ 
ficare come sia possibile ricreare una sensazione 
di campo tridimensionale, pur avendo sorgenti 
registrate in modo statico. Questa sensazione viene 
ricreata anche grazie alla funzionalità offerta dal 
software di simulare le sorgenti a diverse distanze 
dal punto di ascolto, che in questo caso è la sala 
stessa. La figura 20 corrisponde alla rappresentazio¬ 
ne offerta dal sofware di simulazione: il rettangolo 
centrale è la stanza e le circonferenze simulano lo 
spazio di ascolto nell'ipotesi di uno spazio aperto. 
Le sorgenti sonore virtuali sono allocate in modo 
tale che movimento della sorgenti, loro intensità 
e distanza dall'osservatore simuli le condizioni di 
ascolto tridimensionale. L'effetto può essere estra- 
mente realistico: la registrazione dell'abbaiare di un 
cane fermo in una posizione, ad esempio, può dare 
origine alla sensazione, da parte di un ascoltatore, 
di essere circondato da un intero branco di cani. 



Fig. 20 - Gestione delle sorgenti virtuali via software. 
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In questo modo l'unione di elementi come la distan¬ 
za delle sorgenti, il loro movimento e la loro altezza 
permettono di creare la sensazione di profondità del 
campo sonoro nell'ascoltatore. 

Grazie al software è inoltre possibile simulare il 
riverbero tipico di diversi tipi di ambiente. Ciò è 
possibile registrando con dei microfoni Ambisonic 
le componenti di pressione e velocità tipiche di 
alcuni ambienti e successivamente applicandole ai 
vari segnali sonori. Come prova è stato ascoltato 
un brano di musica sinfonica a cui, in tempo reale, 
sono stati applicati i riverberi di una stanza di piccole 
dimensioni, del Teatro Farnese e di una cattedrale. 
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Continua la pubblicazione de LeMiniSerie, raccolte di arti¬ 
coli apparsi nei numeri di Elettronica e Telecomunicazioni 
per facilitarne la lettura e consultazione su temi specifici 
nel campo delle telecomunicazioni. 

La quarta raccolta "Acustica Architettonica e Altoparlanti" 
raccoglie quattro articoli pubblicati nei numeri di aprile, 
agosto e dicembre 2010 e aprile 2011 (ne fa parte, infatti, 
anche uno degli articoli pubblicati in questo numero). 

L'acustica architettonica è fondamentale per la progettazio¬ 
ne di un ambiente adatto a un particolare tipo di ascolto 
come, ad esempio, quello di concerti o conferenze. I tre 
capitoli relativi a questo tema sono dedicati rispettivamente 
alle basi teoriche e aspetti fisici dell'acustica, ai parametri 
di progetto e scelta dei materiali, all'allestimento interno 
degli ambienti. 

Il quarto capitolo è dedicato sistemi di diffusione sonora 
e intende fornire le nozioni base per la scelta del tipo di 
diffusione più adatta al contesto in cui deve e vuole operare. 
Il risultato finale spesso dipende anche dalla scelta del tipo 
di altoparlanti e dal loro posizionamento. 
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